“我真希望我能觸碰你” ,西奧多躺在床上說。 他在愛情中經(jīng)歷了沉默、被拒絕,但這一次他終于聽到了薩曼莎試探性地回應(yīng):“你想怎樣觸碰我呢?”
這只是電影《Her》中動人的一幕:男主角西奧多和他耳朵中的人工智能系統(tǒng)墜入愛河。但是包括工業(yè)設(shè)計師Gadi Amit和易用性大師Don Norman在內(nèi)的多位專家說,這種耳戴式智能硬件(或者“耳穿戴”)已經(jīng)不只存在于科幻小說中,而是馬上就能成為現(xiàn)實。
市場上已經(jīng)出現(xiàn)了一些與電影中異曲同工的*。索尼公司最近推出了一款耳戴式智能硬件,叫 Xperia Ear。 英特爾也展示了一款類似的概念產(chǎn)品。另一款名為 Bragi Dash 的具有生理測試功能的可發(fā)聲設(shè)備也將登陸KickStarters。與此同時,另一家眾籌平臺也籌集了1700萬美元,參與智能耳塞領(lǐng)域的競爭。蘋果公司也參與進來:蘋果將在新版iPhone上取消3.5mm耳機插孔,取而代之的可能是一對無線Beats。難怪交互式界面公司的創(chuàng)始人Mark Stephen說: “我們已經(jīng)和《Her》接近得難以置信了” 。

當(dāng)然啦,要想打造電影中斯嘉麗約翰遜似的沙啞*嗓音,我們還有很多文化、人體工程學(xué)和技術(shù)設(shè)計上的難關(guān)需要攻克。
像iPhone一樣異軍突起的穿戴設(shè)備
歸功于亞馬遜在語音智能領(lǐng)域的技術(shù)突破(亞馬遜不久前發(fā)布了新的Echo),我們終于能夠隨心所欲地在家里和電腦說話了。雖然亞馬遜可能利用Echo扳回一城,但是據(jù)MindMeld的一項研究,只有4%的智能手機用戶用過Alexa。與此同時,62%的市場份額都在其它手機端人工智能助理(如Siri, Google Now, Cortana)手中。這就是為什么Echo早些年在這一領(lǐng)域的勝利果實會迅速被像索尼、蘋果,甚至幾家初創(chuàng)公司的個人設(shè)備廠商瓜分。除非亞馬遜也像電影里的斯嘉麗約翰遜一樣,隨著*,悄悄溜進人們的耳朵,否則難以力挽敗局。
這是一種全新的產(chǎn)品:一種戴在耳朵里的獨立設(shè)備,它能夠聽見你講話并且輕聲回應(yīng)你。它像Siri或者Alexa,它蜷縮在你的耳膜附近,外形是一個戴在耳朵里的隱形無線揚聲器和麥克風(fēng)。業(yè)內(nèi)專家認(rèn)為,這項技術(shù)在未來短短幾年內(nèi)就能實現(xiàn)。想象一下,你即將有一位個人助理為你記錄日常對話,一個調(diào)研員幫你在IMDb上查到了你怎么也想不起來的演員的名字,一個貼心的伴侶不但愿意傾聽你的困惑,還能夠給你提供心理治療……
雖然聽起來科幻,但是很快就能席卷市場。密歇根大學(xué)的助理教授、Clarity-Lab的主任Jason Mars說: “我認(rèn)為耳穿戴能取得iPhone那樣的商業(yè)成功” 。 “有了亞馬遜Echo,人們想出了很多有趣的點子來和自己的房子對話?,F(xiàn)在有了耳穿戴科技,你就可以隨時享受智能助理的協(xié)助了”。

親和性的新高度
耳戴式設(shè)備與生俱來的親和力將決定我們在哪以及如何使用它們。以往,每一個走過你身邊的人都能看見你電腦屏幕上有什么,即便是手機也不能保證絕對私密。但現(xiàn)在,即使人工智能不知道你深藏內(nèi)心的秘密,它至少只在你的耳邊,就像有人貼著你的耳朵說悄悄話。
“在用蘋果手表時,我還是在和一臺機器講話——我在跟我腕子上戴的這東西說話。盡管它快趕上通訊手表了,但它還是做在手表上的一個微創(chuàng)新。”Frog的前首席文化官、Argodesigh的創(chuàng)始人Mark Rolston說, “但是和我自己說話,像有一個鬼魂,一個天使,或者一個魔鬼坐在我肩上,就大不一樣了。怎么說呢,它有更深的心理暗示作用,讓我覺得我腦袋里有另外一個人” 。
Rolston認(rèn)為,私人交互界面的改變將會影響你和人工智能之間的關(guān)系。在一些私密性的事情上,你會很自然地依賴它 ——你可能不想讓你的蘋果手表提醒你什么時候該避孕了,但如果是一句只有自己能聽見的語音提示來告訴你,就容易接受多了。漸漸地,你耳朵里的人工智能會悄悄地查到任何你不好意思當(dāng)著別人的面用Google查找的信息。
“想象一下我在用右耳朵聽你說話,然后Siri在我的左耳朵里教我怎么說,”他說?!斑@樣我就能出色地搞定這個面試,因為面試時有一臺電腦不斷地告訴我各種相關(guān)的問題和概念”。
同時,因為它的無所不知,我們很容易對它產(chǎn)生過高的期待,這會給設(shè)備設(shè)計者帶來麻煩。在日常生活中,我們能根據(jù)情境,對身邊的人抱有比較現(xiàn)實的期待,比如說,我們不會要求干洗店的員工幫我們算12.98%的信用卡最低還款率,也不會讓銀行的人給我們講一個睡前故事。但是對于一個像智能助理這樣的新生科技而言,人們很難判斷什么樣的期待是合理的。用戶可能會把這些平臺當(dāng)作無所不能,在任何情境下都全能的神一般的存在,而不是把它們只是當(dāng)作軟件,并隨之對它們失望。
“AI助理能為我們做什么”和“我們希望它為我們做什么”之間的差距,是現(xiàn)有的人工智能技術(shù)的一個問題?!熬拖馭iri,總會出現(xiàn)很多失靈的情況”,英特爾新式設(shè)備公司的Dan Eisenhardt說。“我總是給Siri機會,但是只要一天中她有一兩次不管用,我就會很失望。所以我就棄用了?!?/p>
在英特爾,Eisenhardt正在通過創(chuàng)建基于音頻、有更具體語境的可穿戴設(shè)備來解決這個問題。在國際消費電子產(chǎn)品展覽會(CES)上,英特爾推出了和Oakley合作研發(fā)的Radar。它將智能眼鏡和耳機結(jié)合在了一起,致力于解決跑步者和騎自行車的人的一些問題。諸如“我跑多遠(yuǎn)了?”或“我的心率是多少?”。因為它了解你所處的語境,所以可以專向理解你在聊的話題。這提高了整體的精確程度。而且它還具備學(xué)習(xí)能力,比如你問系統(tǒng)“我的步調(diào)(或者跑速)”,過一會兒再問“現(xiàn)在怎么樣了”,它就能明白你問的還是步調(diào)。
全新的營銷計劃
那么這個存在于我們耳朵里的人聲,它到底是一個通用的聲音,還是不同公司會給他們的人聲設(shè)定一個不同的性格?目前為止,第三方公司都在爭相采用亞馬遜的Alexa,但是不遠(yuǎn)的將來,這些公司都會努力設(shè)計研發(fā)自己專屬的聲音特征。

“我可以讓Alexa給我訂個Domino的披薩或者叫個Uber,但是這些品牌也會自己投入去研發(fā)個性化的聲音”,Rolston說?!拔覀兠鎸Φ氖且粋€全球性的巨大市場,會有成百上千家聲音品牌出現(xiàn)。他們或許都基于Siri或Alexa的接口,但Alexa無法代表街邊那家披薩店?,F(xiàn)在是Alexa在跟我說話,但是我想要那個醉醺醺的賣披薩的?!?/p>
“解決方案就是讓每個品牌有專屬的聲音,”Rolston接著說?!叭绻以赟iri系統(tǒng)里有個披薩店,可能我就不說‘嘿,Siri’,而是說‘嘿,某某披薩店’。這些披薩店自己也不想聽起來像Siri,他們想成為自己?!?/p>
在Botanic,Mark Meadows研發(fā)出了叫做“Avatars”的聊天機器人,他們能初步實現(xiàn)讓不同的聊天機器人產(chǎn)生不同的個性。比如,心理咨詢師們可以通過同一個虛擬的心理咨詢師來分享業(yè)內(nèi)的知識,或者機修工可以創(chuàng)造他們自己的虛擬機修工。Meadows實際上還為一套Avatars評價系統(tǒng)注冊了專利。就像他所提醒的,人類總是盲目信任機器,而親密感更給了機器難以置信的權(quán)力。
Meadows還提到了最近麥當(dāng)勞的一項促銷活動。這項活動把歡樂兒童餐的餐盒變成了一臺虛擬現(xiàn)實機。他希望麥當(dāng)勞可以利用這項科技制作出一個麥當(dāng)勞叔叔avatar,并且讓它直接和你的孩子們進行對話游戲,而你即便是家長,也無法知道對話內(nèi)容。 “孩子們和麥當(dāng)勞叔叔Avatar的關(guān)系可以讓品牌更高效地和消費者互動。此時麥當(dāng)勞叔叔已經(jīng)不是你在電視上看到的那個奇怪的小丑了,”他說?!八兂闪艘粋€親密的朋友,會悄悄向你的孩子提供消費建議”。
Meadow認(rèn)為一個評價系統(tǒng)可以制衡這種品牌能力。他申請了一項聊天機器人“牌照”,這是一個評價系統(tǒng)的專利,可以發(fā)現(xiàn)有可能濫用人工智能聊天機器人的行為。這套評價系統(tǒng)介于Twitter的認(rèn)證和Amazon的評星級之間。
基礎(chǔ)設(shè)施的挑戰(zhàn)
對于iPhone用戶來說,用Siri至多感覺像是進行了一次軟件更新,這是因為使用Siri的成本是無形的。真正的操作遠(yuǎn)在北卡羅來納,蘋果在Siri上線之前就建立了全世界第一個數(shù)據(jù)中心,耗資10億美元。隱藏的計算成本剛好能解釋,為什么運營著地球上最大的服務(wù)器網(wǎng)絡(luò)的亞馬遜能在語音智能方面占優(yōu)勢。但盡管如此,我們還遠(yuǎn)遠(yuǎn)到不了電影《her》描述的智能世界。
“如果每個人都希望不間斷地和Siri或者Cortana交流,當(dāng)這些交流同時進行時,我們的數(shù)據(jù)中心根本應(yīng)付不了如此巨大的數(shù)據(jù)流量,”Mars說?!翱隙ㄓ幸恍┬枨笤诩夹g(shù)上不能得到滿足,就像我們不能讓地球上每臺手機同時下載視頻一樣,因為手機信號無法支撐。沒有任何一個服務(wù)器可以滿足成百萬甚至幾十億人同時且不間斷地和智能助理對話?!?/p>
試想當(dāng)你打開Siri時,總會有一些故障出現(xiàn)。難道蘋果沒試圖處理這些故障碼?他們當(dāng)然做了。但是人們是不是越來越少地使用Siri了呢?也許是吧。Mars表示Siri已經(jīng)很難有所改進, “每做一丁點質(zhì)量上的改進,或者每增加一些用戶,運行Siri的成本就會飆升?!?人工智能越是聰明,就需要越大的數(shù)據(jù)處理系統(tǒng),這絕不是再建幾個大服務(wù)器基地就能解決的問題。我們需要能處理更大數(shù)量級數(shù)據(jù)的服務(wù)器。這就是為什么在Mars的實驗室,他在研究如何設(shè)計出能十倍甚至百倍提高運算律的服務(wù)器。例如,如果一個人的手機能夠處理更多的數(shù)據(jù),就可以讓服務(wù)器操縱特殊的手機硬件來運行一些人工智能軟件,這或許是條路。
所以我們依舊不清楚我們是否要讓智能助手無處不在。如果基礎(chǔ)設(shè)施只能支持一小部分用戶,公司將如何篩選誰可以先用上這項技術(shù)?這些人在技術(shù)的協(xié)助下將比我們變得優(yōu)秀多少?Mars相信迅速發(fā)展的耳戴助手會加速服務(wù)器瓶頸的到來。
設(shè)計耳穿戴
當(dāng)然,服務(wù)器只是硬件問題之一。耳穿戴的熱銷不代表它們已經(jīng)技術(shù)成熟并進入全盛。硅谷New Deal Design設(shè)計公司的創(chuàng)始人Gadi Amit就不認(rèn)為現(xiàn)今的耳戴硬件設(shè)備有索尼公司或者其他初創(chuàng)公司說的那么好。
一方面,就舒適度而言這些耳塞戴起來特別難受。比方說,有些人覺得蘋果的耳塞棒極了,而另一些人連戴幾秒鐘都無法忍受。一旦設(shè)計者把塞繩去掉(塞繩用來支撐耳塞的重量以在你的耳朵中固定耳塞),索尼和蘋果的技術(shù)都不能提供其他固定方案,除非讓你的耳道自己卡住耳塞。
“主要的問題之一是耳塞會掉出來。你塞回去他還是會在你做任何動作的時候再次掉出來,”Amit說?!皼]有辦法解決這個問題,只能把它拿出來,再通過別的途徑掛在耳朵外邊。”但是一旦你把設(shè)備掛在了耳朵外邊,這個設(shè)備的一切精巧性就都沒了。外加你還得忍受耳廓的疼痛。
“舒適性的問題就擺在那,它是一個因人而異的事情。有的人覺得可以接受,但有的人就完全不能接受”,他說。“永遠(yuǎn)都不會有100%的滿意度,特別是在用戶跑步的時候。整體滿意度將只能徘徊在30%或50%” 。 他把這和觸屏作比較,觸屏在任何時候總是能達到100%的滿意度。
Amit迅速反應(yīng)到的另一個問題是聲音質(zhì)量的問題。聲音產(chǎn)品市場已經(jīng)有消費者在追求更高音質(zhì)的外戴式耳機。參照其在過去十年的緩慢發(fā)展進程,微型聽覺設(shè)備不會在近期有什么大的起色。同樣地,麥克風(fēng)和聲音識別系統(tǒng)也存在著諸多限制,即便是他們很好用,在實際生活應(yīng)用中精確度也只能達到90%。
“這聽起來挺高的,但實際上慘不忍睹。試想你在進行一次正常對話,如果聽不懂其中的5%,會很難理解對話內(nèi)容”,Amit說?!皩τ谝恍?yīng)用程序來說這已經(jīng)很好了,但是如果我們想在未來幾年用耳朵徹底取代圖形用戶界面,要走的路還非常遠(yuǎn)”。
相反地,Amit想象中不久的將來會是各種交互方式交織的狀況,這其中耳中電腦或者聲控系統(tǒng)將只是一個組成部分。盡管他相信圖形用戶界面在2015年達到了頂峰,他對任何單一突破(比如iPhone的觸屏)全盤吞沒其他方式的用戶體驗的可能性深表懷疑?,F(xiàn)在我們有能夠讀懂手勢和面部表情的技術(shù),我們有可視頭機讓我們在視頻內(nèi)容中身臨其境,我們甚至有能夠傳導(dǎo)身體感受的觸覺感受裝置。
“我們有五種感官,我們要實現(xiàn)全部五種感官和智能科技的交互體驗” ,Amit說。 “我們現(xiàn)在設(shè)計這些項目時遇到的真正困難是如何找到正確的結(jié)合方式,并能適應(yīng)用戶多元的舒適度要求。如何混搭是我們現(xiàn)在面臨的最大挑戰(zhàn)。我們有各種各樣的技術(shù),就看你如何將他們搭配起來”。
就像Meadows說的那樣,當(dāng)這些技術(shù)同時發(fā)揮作用的時候,他們運行得更加和諧也更加準(zhǔn)確。他們可以理解我們在說什么以及我們的感受。
這就是為什么蘋果最近并購了兩家你幾乎都沒聽說過的公司:Emotient,一個情緒識別軟件,能夠在半秒鐘的時間里通過人類表情識別情緒;Faceshift,一個可以記錄人臉并同步到虛擬人像上的軟件。放到一起,這兩宗并購預(yù)示著如果Siri不僅能聽到你還能見到你,她將變得更加智能化。同時如果你也能看到她,她也許也會變得更為打動人。
失落的一角:*直覺
相比于數(shù)據(jù)中心和人體工程學(xué)限制,甚至是潛在的企業(yè)濫用親密度的問題,耳戴助手面臨的最大挑戰(zhàn)來自于你耳朵中的人工智能設(shè)備很難掌握哪些細(xì)小的、*化的因素。
“現(xiàn)在你有助手告訴你你最喜歡的意大利餐廳開門了,你有可能大為欣喜,”圣迭戈加州大學(xué)的設(shè)計實驗室主任、《日常設(shè)計》(The Design of Everyday Things)的作者Don Norman說。“但是也有可能是在你開車或者過馬路時,又或者當(dāng)你終于和你的愛人進行深入的談話的時候。最難以把握的部分是那些社交細(xì)節(jié)、時機,知道哪些時候適合或者不適合向你提供信息”。
耳戴助手將不得不經(jīng)常費力應(yīng)對這些只能憑直覺判斷的社交場合,因為Norman相信耳戴助手的最大潛在益處在于能利用一天中一些5秒、10秒、30秒的零散時間。用這些時間他也許能查一下電子郵箱或者手機短信,都加起來也是一段相當(dāng)可觀的時間。但他還是為一個沒有社交能力的電腦可能表現(xiàn)出的危險的莽撞行為而擔(dān)憂。
“我擔(dān)心的是安全。我們已經(jīng)知*們因為走路時看手機而受傷。他們會撞到東西,但是至少手機是在你可控范圍內(nèi)的。你可以想什么時候不看就不看。你可以強迫你自己不看, “他說。 “我過馬路時從來不看手機。但是如果這是一個助手,給我建議、向我推薦東西、告訴我一些它覺得我可能感興趣的事情,我沒有辦法控制它什么時候告訴我,這就有可能給我?guī)砦kU”。
在他的實驗室,Norman正在通過研究汽車的自動化裝置研究這些復(fù)雜的*界限。換句話說,一輛無人駕駛的汽車如何穿越繁忙的人行道口?!斑@些車不得不硬闖,要不它們就沒辦法穿越如織的行人”,他說。所以這就要求這些汽車編程能夠適應(yīng)當(dāng)?shù)仄嚭托腥说奈幕T诩永D醽?,這意味著汽車一步步慢慢向前推進,行人自由走動。但是在亞洲,這就意味著汽車需要更加強力地突破人群,甚至是強塞過去。兩種程序在當(dāng)?shù)囟寄茏嘈?,但是如果你想調(diào)換這兩者,加州的汽車會一天都呆在亞洲的十字路口動彈不得,而亞洲汽車會把加州的行人撞翻。
所以真的很復(fù)雜。
雖然對于那些《火線密令》里出來的神經(jīng)敏感的人來說,《她》里面的科技將把我們帶到世界末日,但是想到我們已經(jīng)每天玩不止150次智能手機了,如果這都不能抹煞人類本性,一項新科技就毀滅*恐怕也不可能。
“我走到我辦公室的路上要遇到很多學(xué)生。我很驚奇地發(fā)現(xiàn)他們中90%都在步行穿過校園時看手機” ,Norman說。 “我試圖了解他們在干什么,但是大部分情況下他們看上去都挺開心的。他們看得很入神。我不認(rèn)為是科技讓他們想要這么做。我想科技只是讓他們能夠隨時保持聯(lián)系?!?/p>



